Hypothesis Testing in R (t-test, chi-square test)
Hypothesis Testing হল একটি পরিসংখ্যানিক প্রক্রিয়া যার মাধ্যমে একটি দাবী বা হাইপোথিসিসের সত্যতা পরীক্ষা করা হয়। এর মধ্যে দুটি মৌলিক ধাপ রয়েছে:
- Null hypothesis (H₀): একটি দাবী যা সাধারণত প্রমাণ করার চেষ্টা করা হয়, যেমন "কোনো পার্থক্য নেই" বা "কোনো সম্পর্ক নেই"।
- Alternative hypothesis (H₁): যা দাবি করে যে, কোনো পার্থক্য বা সম্পর্ক আছে।
R প্রোগ্রামিং ভাষায় দুটি সাধারণ হাইপোথিসিস টেস্ট হলো:
- t-test (t পরিসংখ্যানিক পরীক্ষা)
- Chi-square test (Chi-square পরিসংখ্যানিক পরীক্ষা)
এই টেস্টগুলি ব্যবহার করে আপনি বিভিন্ন ধরণের পরিসংখ্যানিক পরীক্ষা পরিচালনা করতে পারবেন, যেমন দুটি গোষ্ঠীর মধ্যে পার্থক্য পরীক্ষা করা বা ক্যাটাগরিকাল ডেটার মধ্যে সম্পর্ক নির্ধারণ করা।
১. t-test
t-test ব্যবহৃত হয় দুটি গোষ্ঠীর মধ্যে গড় (mean) তুলনা করার জন্য, এবং এটি সাধারণত পরীক্ষা করা হয় যে, দুটি গোষ্ঠীর মধ্যে গড়ের পার্থক্যটি পরিসংখ্যানিকভাবে গুরুত্বপূর্ণ কিনা।
t-test তিন ধরনের হতে পারে:
- One-sample t-test: একটি গোষ্ঠীর গড় নির্দিষ্ট মানের সাথে তুলনা করা হয়।
- Two-sample t-test: দুটি আলাদা গোষ্ঠীর গড় তুলনা করা হয়।
- Paired t-test: এক গোষ্ঠীর আগে এবং পরে পরীক্ষার মধ্যে গড় তুলনা করা হয়।
One-sample t-test:
এই টেস্টে, আপনি একটি গোষ্ঠীর গড় নির্দিষ্ট মানের সাথে তুলনা করেন।
# One-sample t-test উদাহরণ
data <- c(45, 50, 55, 60, 65, 70, 75)
t_test_result <- t.test(data, mu = 60) # mu = 60 হচ্ছে নির্ধারিত গড়
print(t_test_result)এখানে, mu = 60 মানে আমরা পরীক্ষা করছি যে, গোষ্ঠীর গড় ৬০ এর সমান কিনা।
Two-sample t-test:
এই টেস্টে, আপনি দুটি গোষ্ঠীর গড় তুলনা করেন।
# Two-sample t-test উদাহরণ
group1 <- c(45, 50, 55, 60, 65)
group2 <- c(70, 75, 80, 85, 90)
t_test_result <- t.test(group1, group2)
print(t_test_result)এখানে, t.test() ফাংশন দুটি গোষ্ঠী (group1 এবং group2) এর মধ্যে গড়ের পার্থক্য পরীক্ষা করে।
Paired t-test:
এই টেস্টে, আপনি একই গোষ্ঠীর আগে এবং পরে মান তুলনা করেন।
# Paired t-test উদাহরণ
before <- c(45, 50, 55, 60, 65)
after <- c(55, 60, 65, 70, 75)
t_test_result <- t.test(before, after, paired = TRUE)
print(t_test_result)এখানে, paired = TRUE দিয়ে নির্দেশ করা হয়েছে যে, এটি একটি পেয়ারড t-test এবং before এবং after ভেরিয়েবলগুলির মান তুলনা করবে।
২. Chi-square Test
Chi-square test সাধারণত ক্যাটাগোরিকাল ডেটার জন্য ব্যবহৃত হয়। এটি পরীক্ষা করে যে, দুটি ক্যাটাগোরির মধ্যে সম্পর্ক বা একে অপরের উপর নির্ভরশীলতা আছে কিনা।
Chi-square test for independence:
এটি দুইটি ক্যাটাগোরিকাল ভেরিয়েবলের মধ্যে সম্পর্ক পরীক্ষা করে।
# Chi-square test for independence উদাহরণ
data <- matrix(c(10, 20, 30, 40), nrow = 2)
colnames(data) <- c("Group1", "Group2")
rownames(data) <- c("Male", "Female")
chi_square_result <- chisq.test(data)
print(chi_square_result)এখানে, chisq.test() ফাংশনটি একটি কন্টিঞ্জেন্সি টেবিল (data) দিয়ে দুটি ক্যাটাগোরির মধ্যে সম্পর্ক পরীক্ষা করবে। টেস্টের ফলস্বরূপ আপনাকে Chi-square value, p-value এবং ডিগ্রী অফ ফ্রিডম (degree of freedom) সহ অন্যান্য পরিসংখ্যানিক তথ্য দেওয়া হবে।
Chi-square goodness of fit test:
এই টেস্টটি ব্যবহার করা হয়, যখন আপনি পরীক্ষা করতে চান একটি ক্যাটাগোরির মধ্যে ফ্রিকোয়েন্সি (frequency) নির্দিষ্ট একটি থিওরিটিক্যাল ডিস্ট্রিবিউশনের সাথে মেলে কিনা।
# Chi-square goodness of fit test উদাহরণ
observed <- c(10, 20, 30) # পর্যবেক্ষিত মান
expected <- c(15, 15, 30) # প্রত্যাশিত মান
chi_square_result <- chisq.test(observed, p = expected/sum(expected))
print(chi_square_result)এখানে, observed হল আসল পর্যবেক্ষিত ফ্রিকোয়েন্সি এবং expected হল প্রত্যাশিত ফ্রিকোয়েন্সি।
Hypothesis Testing Summary
- t-test: দুটি গোষ্ঠীর মধ্যে গড়ের পার্থক্য পরীক্ষা করার জন্য ব্যবহৃত হয়।
- One-sample t-test: একটি গোষ্ঠীর গড় নির্দিষ্ট মানের সাথে তুলনা।
- Two-sample t-test: দুটি আলাদা গোষ্ঠীর গড় তুলনা।
- Paired t-test: এক গোষ্ঠীর আগে এবং পরে পরীক্ষার গড় তুলনা।
- Chi-square test: ক্যাটাগোরিকাল ডেটার জন্য ব্যবহৃত হয়।
- Chi-square test for independence: দুটি ক্যাটাগোরির মধ্যে সম্পর্ক পরীক্ষা।
- Chi-square goodness of fit test: পর্যবেক্ষিত ফ্রিকোয়েন্সি এবং প্রত্যাশিত ফ্রিকোয়েন্সির মধ্যে পার্থক্য পরীক্ষা।
এভাবে, t-test এবং Chi-square test ব্যবহার করে আপনি বিভিন্ন ধরনের পরিসংখ্যানিক পরীক্ষা পরিচালনা করতে পারবেন এবং ফলাফলগুলি বিশ্লেষণ করতে পারবেন।
Read more